KL散度衡量的是在一个概率分布�P中获取信息所需的额外位数相对于使用一个更好的分布�Q所需的额外位数的期望值。要在训练中使用KL散度作为损失函数,可以将其作为模型的一部分加入到损失函数的计算中。在机器学习中,...
浏览 76 次 标签: 损失函数——KL散度(Kullback-Leibler Divergence KL Divergence)